En el marco socioeconómico de la Unión Europea, la cohesión territorial y la reducción de las desigualdades siguen siendo desafíos primordiales. Si bien los indicadores macroeconómicos nacionales suelen acaparar la atención mediática, la renta disponible de los hogares se erige como el indicador más fiel para medir el bienestar real de la ciudadanía, su capacidad de consumo y su nivel de ahorro. En la coyuntura actual, marcada por la recuperación post-pandemia y las tensiones inflacionarias, analizar la evolución de la riqueza familiar no es solo un ejercicio estadístico, sino una herramienta fundamental para evaluar la salud económica real de las familias y la efectividad de las políticas de convergencia europeas.
El problema central que aborda este proyecto radica en que los promedios nacionales a menudo enmascaran profundas disparidades internas. Un análisis limitado al nivel de país (NUTS 0) es insuficiente para comprender la realidad de territorios con dinámicas propias. Por tanto, este estudio desciende al nivel NUTS 2 para visibilizar estas brechas, delimitando el análisis a la evolución comparada de las regiones europeas durante las últimas dos décadas (2000-2022). Específicamente, se pone el foco en la posición relativa de las Comunidades Autónomas españolas, y de manera singular en Canarias como región ultraperiférica, para determinar si existe una convergencia real en términos de renta neta y poder adquisitivo (PPS) frente a los estándares europeos o si, por el contrario, la brecha regional tiende a perpetuarse.
Una de las principales motivaciones que me ha llevado a elegir un dataset de este tema es una aspiración que tengo de vivir o estudiar fuera de España, sobretodo por temas laborales entre otros y por calidad de vida. Yo considero que los aspectos económicos son un factor muy importante a tener en cuenta para esto, el poder comparar a España con otros países o incluso poder comparar España internamente para ver como es económicamente en distintos factores es algo que me ha impulsado a elegir este tema de trabajo. Además, las cuestiones económicas siempre me han llamado más la atención que cualquier otra.
| ODS | No procede | Bajo | Medio | Alto |
|---|---|---|---|---|
| 1 Fin de la Pobreza | X | |||
| 2 Hambre cero | X | |||
| 3 Salud y Bienestar | X | |||
| 4 Educación de calidad | X | |||
| 5 Igualdad de género | X | |||
| 6 Agua limpia y saneamiento | X | |||
| 7 Energía Asequible y no contaminante | X | |||
| 8 Trabajo decente y crecimiento económico | X | |||
| 9 Industria, Innovación e Infraestructuras | X | |||
| 10 Reducción de las desigualdades | X | |||
| 11 Ciudades y comunidades sostenibles | X | |||
| 12 Producción y consumo sostenibles | X | |||
| 13 Acción por el clima | X | |||
| 14 Vida submarina | X | |||
| 15 Vida de ecosistemas terrestres | X | |||
| 16 Paz, justicia e instituciones sólidas | X | |||
| 17 Alianzas para lograr objetivos | X |
Utilizaremos la metodología de desarrollo CRISP-DM (Cross Industry Standard Process for Data Mining) que es un marco ampliamente utilizado para proyectos de Ciencias de Datos. En la siguiente figura se presenta un diagrama con las diferentes fases de esta metodología que a continuación describimos con más detalle:
Diagrama metodología de desarrollo CRISP-DM
Es importante observar que esta metodología es iterativa, es decir que los resultados obtenidos en algunas de las fases puede afectar al desarrollo de fases anteriores.
A continuación se describirá en detalle como se han abordado cada una de las fases del desarrollo del proyecto siguiendo esta metodología.
Para la búsqueda de datos, lo que se ha hecho es buscar directamente en la lista de datasets de Eurostat, en primer lugar había encontrado un dataset interesante pero este prácticamente hacía imposible la combinación de atributos además de tener inexistentes o pocos datos para España y Canarias, finalmente encontré el dataset con el que he trabajado y en este caso apenas he tenido incidencias o dificultades.
Para la búsqueda del segundo dataset han existido mas problemas ya que principalmente teníamos un dataset de población y sumábamos por grupos para concentrar a la poblacion entre 15 y 65 años y de esta manera normalizar los valores de los atributos, sin embargo, este dataset tenía problemas ya que los valores eran observaciones tomadas el 1 de enero de cada año, esto hacía que los resultados fueran valores lejanos de la realidad. El problema es que normalmente para calcular datos económicos per cápita no se suele separar por grupos y lo que se hace es tomar datos de poblaciones que representen la media de la población en un año, dicho esto, tuve que buscar otro dataset que contaba con estas característica y que proporcionaba valores mucho más exactos.
El conjunto de datos contiene información anual sobre diversas partidas de ingreso de los hogares, desglosada por regiones NUTS. Las variables categóricas (dimensiones) que estructuran el dataset se describen a continuación:
Frecuencia de las observaciones (freq)
-> Define la periodicidad con la que se registran las
observaciones.
Unidad de Medida (unit) ->
Especifica la unidad utilizada para expresar el valor numérico
(values) de la observación. Es crucial para garantizar la
comparabilidad de los datos.
EUR_HAB -> Euros por habitante. Muestra la cifra de ingresos dividida por el número de personas en la región. Se utiliza para medir la renta promedio individual en euros. No está ajustada por lo que valen las cosas en esa región.
MIO_EUR -> Millones de Euros. Es el valor total de los ingresos de la región. Se utiliza para medir el tamaño o volumen total de la economía regional en la moneda común.
MIO_NAC -> Millones de Moneda Nacional. Es el valor total en la moneda del país antes de que adoptara el Euro (por ejemplo, en pesetas o francos). Solo es útil para analizar datos de años anteriores a la zona Euro.
MIO_PPS_EU27_2020 -> Millones de Estándares de Poder Adquisitivo (PPS). El PPS es una “moneda de comparación” que elimina el efecto de los precios. Si una región es muy cara, el PPS ajusta el ingreso a la baja; si es barata, lo ajusta al alza. Se usa para comparar el volumen económico real entre regiones.
PPS_EU27_2020_HAB -> PPS por habitante. Es la métrica más valiosa para las comparaciones. Muestra el ingreso promedio por persona, pero ajustado por el costo de vida. Esta unidad refleja de forma más precisa el nivel de vida real y la capacidad de compra de los habitantes en distintas regiones.
Dirección de Flujo (direct) ->
Indica la naturaleza de la transacción económica, especificando si es un
saldo o una operación de pago/recepción.
BAL (Balance): Representa un saldo neto (la diferencia entre ingresos y gastos o entre activos y pasivos). Es el resultado final de una cuenta económica.
PAID (Pagado): Hace referencia al valor de las transferencias o pagos realizados por el sector de los hogares.
RECV (Recibido): Hace referencia al valor de los ingresos o transferencias recibidas por el sector de los hogares.
Indicador de Cuentas Nacionales
(na_item) -> Esta es la dimensión clave que define la
variable económica exacta que se está midiendo, siguiendo la
nomenclatura del Sistema Europeo de Cuentas (SEC 2010).
B5N -> Ingreso Primario Neto: El saldo de las rentas que reciben los hogares por su participación directa en la producción y la propiedad (salarios, rentas de la propiedad e ingresos de autoempleo), antes de transferencias e impuestos.
B6N -> Ingreso Disponible Neto: El saldo final que queda en manos de los hogares para consumo o ahorro, una vez que se han restado los impuestos y añadido las prestaciones sociales.
B7N -> Ahorro Neto: La porción del Ingreso Disponible que no se consume. Es la diferencia entre el Ingreso Disponible y el Gasto en Consumo Final.
D1 -> Remuneración de los Asalariados: El total de salarios y cotizaciones sociales pagadas por los empleadores. Es un componente clave del Ingreso Primario.
D4 -> Rentas de la Propiedad: Ingresos recibidos de la propiedad de activos (intereses, dividendos, rentas de la tierra, etc.).
D61 -> Cotizaciones Sociales Netas: Contribuciones pagadas a la seguridad social, ajustadas para reflejar las cuentas netas.
D62 -> Prestaciones Sociales Distintas de las Transferencias Sociales en Especie: Los beneficios que los hogares reciben del Estado (pensiones, prestaciones por desempleo, etc.) en forma de dinero.
D63 -> Transferencias Sociales en Especie: Bienes y servicios proporcionados gratuitamente o a precios bajos por el Estado (como servicios de salud o educación).
D7 -> Otras Transferencias Corrientes: Partidas residuales de transferencias monetarias no clasificadas en las anteriores categorías.
B2A3N -> Excedente Bruto de Explotación y Renta Mixta: El beneficio derivado de las actividades de producción, en el contexto de los hogares suele referirse al ingreso de los trabajadores autónomos (renta mixta).
P3 -> Gasto en Consumo Final: El valor de los bienes y servicios utilizados por los hogares para la satisfacción directa de sus necesidades.
P51C -> Formación Bruta de Capital Fijo: La inversión en activos fijos (viviendas, maquinaria, etc.) por parte del sector de los hogares.
Región Geográfica (geo) -> Define la
región geográfica a la que se refiere la observación, utilizando la
Nomenclatura Común de Unidades Territoriales de Estadística (NUTS).
Valores: Los valores son códigos alfanuméricos estandarizados:
Códigos de dos letras (e.g., AT, BE, ES): Representan el total del país (ejemplo, Austria, Bélgica, España).
Códigos NUTS 1, NUTS 2 y NUTS 3 (e.g., AT1, AT11, AT111): Representan el desglose regional de los datos. NUTS 2 es el nivel predominante en este dataset (por ejemplo, Comunidades Autónomas, grandes regiones).
Las observaciones (variables no categóricas) con valor numérico que aparecen en este dataset son:
Fecha de la observación (TIME_PERIOD)
-> Esta variable especifica el punto temporal al que
se refiere el valor registrado. En un dataset con frecuencia
Anual (freq = "A"), esta columna contendrá
el año de la observación, en este caso, tomada el primer día del
año.
Valor de la observación (values) ->
Esta es la variable numérica principal que contiene la
medida estadística de interés.
na_item): Por ejemplo, si
es Ingreso Disponible Neto (B6N).unit): Por ejemplo, si
está en Euros por habitante (EUR_HAB).geo): La región NUTS 2.TIME_PERIOD): El año de la
medición.## COLUMNA: freq
## freq N.Observ full_name
## [1,] A 285294 Annual
## COLUMNA: unit
## unit N.Observ full_name
## [1,] MIO_EUR 115674 Million euro
## [2,] MIO_NAC 115674 Million units of national currency
## [3,] MIO_PPS_EU27_2020 18176 Million purchasing power standards (PPS,..
## [4,] EUR_HAB 17885 Euro per inhabitant
## [5,] PPS_EU27_2020_HAB 17885 Purchasing power standard (PPS, EU27 fro..
## COLUMNA: direct
## direct N.Observ full_name
## [1,] BAL 110856 Balance
## [2,] PAID 89588 Paid
## [3,] RECV 84850 Received
## COLUMNA: na_item
## na_item N.Observ full_name
## [1,] B5N 44072 Balance of primary incomes/national inco..
## [2,] B6N 44072 Disposable income, net
## [3,] D4 36100 Property income
## [4,] D7 36100 Other current transfers
## [5,] D61 28370 Net social contributions
## [6,] D62 28106 Social benefits other than social transf..
## [7,] D1 18242 Compensation of employees
## [8,] B2A3N 18162 Operating surplus and mixed income, net
## [9,] D5 18050 Current taxes on income, wealth, etc.
## [10,] P51C 4986 Consumption of fixed capital
## [11,] B7N 4550 Adjusted disposable income, net
## [12,] P3 2346 Final consumption expenditure
## [13,] D63 2138 Social transfers in kind
##
## CONTABILIZACIÓN Nº REGIONES NUTS A PARTIR DE LA COLUMNA geo
## NUTS Number of Regions
## [1,] 0 29
## [2,] 1 94
## [3,] 2 251
## [4,] EU27_2020 1
## [5,] OTHERS 15
##
## COLUMNA: TIME_PERIOD
## TIME_PERIOD N.observ
## [1,] 1995-01-01 2230
## [2,] 1996-01-01 2230
## [3,] 1997-01-01 2230
## [4,] 1998-01-01 2230
## [5,] 1999-01-01 2230
## [6,] 2000-01-01 11590
## [7,] 2001-01-01 11590
## [8,] 2002-01-01 11590
## [9,] 2003-01-01 11590
## [10,] 2004-01-01 11590
## [11,] 2005-01-01 11590
## [12,] 2006-01-01 11596
## [13,] 2007-01-01 11596
## [14,] 2008-01-01 11632
## [15,] 2009-01-01 11632
## [16,] 2010-01-01 11688
## [17,] 2011-01-01 11928
## [18,] 2012-01-01 11928
## [19,] 2013-01-01 11928
## [20,] 2014-01-01 11932
## [21,] 2015-01-01 11884
## [22,] 2016-01-01 11942
## [23,] 2017-01-01 11942
## [24,] 2018-01-01 11942
## [25,] 2019-01-01 11942
## [26,] 2020-01-01 12168
## [27,] 2021-01-01 12154
## [28,] 2022-01-01 11724
## [29,] 2023-01-01 3046
El dataset (nama_10r_2hhinc) se presenta en una
estructura ordenada (tidy). Esta organización
se define porque cada fila representa una única
observación. Es decir, la combinación de las variables
categóricas (geo, na_item, unit,
etc.) y la variable temporal (TIME_PERIOD) define de forma
unívoca la medición. El resultado de esta medición se almacena en una
sola columna numérica (values). Este formato, también
conocido como “formato largo,” es el más eficiente y recomendado para la
manipulación y el análisis directo de datos en entornos de software
estadístico como R.
## tibble [285,294 × 7] (S3: tbl_df/tbl/data.frame)
## $ freq : chr [1:285294] "A" "A" "A" "A" ...
## $ unit : chr [1:285294] "MIO_EUR" "MIO_EUR" "MIO_EUR" "MIO_EUR" ...
## $ direct : chr [1:285294] "BAL" "BAL" "BAL" "PAID" ...
## $ na_item : chr [1:285294] "B2A3N" "B5N" "B6N" "D4" ...
## $ geo : chr [1:285294] "BE" "BE" "BE" "BE" ...
## $ TIME_PERIOD: Date[1:285294], format: "1995-01-01" "1995-01-01" ...
## $ values : num [1:285294] 24926 168359 135254 3783 29816 ...
El tamaño máximo de las series temporales es 29 y se cumplen los requisitos de longitud de series temporales. Tenemos datos desde el año 1995 hasta 2023, pero en especial, la mayor cantidad de observaciones se da entre los años 2000 y 2022.
## # A tibble: 1 × 7
## min p10 p25 p50 p75 p90 max
## <int> <dbl> <dbl> <dbl> <dbl> <dbl> <int>
## 1 2 23 23 23 24 29 29
En cuanto a la distribución del número de observaciones, tenemos que
p50 = 736 y que el máximo es 1188 lo cual está bien
teniendo en cuenta de que en su mayoría, este dataset tiene datos sobre
regiones NUTS2. Además, España y Canarias son regiones que son
interesantes y ambas cuenta con un buen número de observaciones, 934
para ser exactos.
Percentiles de la distribución del nº de observaciones por regiones
## # A tibble: 1 × 7
## min p10 p25 p50 p75 p90 max
## <int> <dbl> <dbl> <dbl> <dbl> <dbl> <int>
## 1 34 644 644 736 796 934 1188
Nº de observaciones en España/Canarias
## # A tibble: 3 × 3
## geo full_name N.Observ
## <chr> <chr> <int>
## 1 ES Spain 934
## 2 ES7 Canarias 934
## 3 ES70 Canarias 934
Los datos nos proporcionan un total de 42 posibles combinaciones de las variables categóricas, cada combinación con número de observaciones por lo general cercano a 9000, aunque también vemos algunas pocas que tienen entre 1000 y 5000 observaciones.
## # A tibble: 42 × 7
## # Groups: freq, unit, direct [9]
## freq unit direct na_item N.observ init.date end.date
## <chr> <chr> <chr> <chr> <int> <date> <date>
## 1 A MIO_EUR RECV D1 9121 1995-01-01 2023-01-01
## 2 A MIO_NAC RECV D1 9121 1995-01-01 2023-01-01
## 3 A MIO_EUR BAL B5N 9088 1995-01-01 2023-01-01
## 4 A MIO_EUR BAL B6N 9088 1995-01-01 2023-01-01
## 5 A MIO_NAC BAL B5N 9088 1995-01-01 2023-01-01
## 6 A MIO_NAC BAL B6N 9088 1995-01-01 2023-01-01
## 7 A MIO_PPS_EU27_2020 BAL B5N 9088 1995-01-01 2023-01-01
## 8 A MIO_PPS_EU27_2020 BAL B6N 9088 1995-01-01 2023-01-01
## 9 A MIO_EUR BAL B2A3N 9081 1995-01-01 2023-01-01
## 10 A MIO_NAC BAL B2A3N 9081 1995-01-01 2023-01-01
## 11 A MIO_EUR PAID D61 9065 1995-01-01 2023-01-01
## 12 A MIO_EUR RECV D62 9065 1995-01-01 2023-01-01
## 13 A MIO_NAC PAID D61 9065 1995-01-01 2023-01-01
## 14 A MIO_NAC RECV D62 9065 1995-01-01 2023-01-01
## 15 A MIO_EUR PAID D4 9025 1995-01-01 2023-01-01
## 16 A MIO_EUR PAID D5 9025 1995-01-01 2023-01-01
## 17 A MIO_EUR PAID D7 9025 1995-01-01 2023-01-01
## 18 A MIO_EUR RECV D4 9025 1995-01-01 2023-01-01
## 19 A MIO_EUR RECV D7 9025 1995-01-01 2023-01-01
## 20 A MIO_NAC PAID D4 9025 1995-01-01 2023-01-01
## 21 A MIO_NAC PAID D5 9025 1995-01-01 2023-01-01
## 22 A MIO_NAC PAID D7 9025 1995-01-01 2023-01-01
## 23 A MIO_NAC RECV D4 9025 1995-01-01 2023-01-01
## 24 A MIO_NAC RECV D7 9025 1995-01-01 2023-01-01
## 25 A EUR_HAB BAL B5N 8404 2000-01-01 2023-01-01
## 26 A EUR_HAB BAL B6N 8404 2000-01-01 2023-01-01
## 27 A PPS_EU27_2020_HAB BAL B5N 8404 2000-01-01 2023-01-01
## 28 A PPS_EU27_2020_HAB BAL B6N 8404 2000-01-01 2023-01-01
## 29 A MIO_EUR RECV D61 5120 1995-01-01 2023-01-01
## 30 A MIO_NAC RECV D61 5120 1995-01-01 2023-01-01
## 31 A MIO_EUR PAID D62 4988 1995-01-01 2023-01-01
## 32 A MIO_NAC PAID D62 4988 1995-01-01 2023-01-01
## 33 A MIO_EUR PAID P51C 2493 1995-01-01 2023-01-01
## 34 A MIO_NAC PAID P51C 2493 1995-01-01 2023-01-01
## 35 A MIO_EUR BAL B7N 1198 1995-01-01 2023-01-01
## 36 A MIO_NAC BAL B7N 1198 1995-01-01 2023-01-01
## 37 A MIO_EUR PAID P3 1173 1995-01-01 2023-01-01
## 38 A MIO_NAC PAID P3 1173 1995-01-01 2023-01-01
## 39 A EUR_HAB BAL B7N 1077 2000-01-01 2023-01-01
## 40 A PPS_EU27_2020_HAB BAL B7N 1077 2000-01-01 2023-01-01
## 41 A MIO_EUR RECV D63 1069 1995-01-01 2023-01-01
## 42 A MIO_NAC RECV D63 1069 1995-01-01 2023-01-01
En general, no se han encontrado inconsistencias y no hay datos faltantes en los casos de España y Canarias, que son las regiones más interesantes.
Visualización España/Canarias (máximo 60 columnas y 1000 filas por región)
A continuación veremos información sobre nuestro dataset
secundario que incluye datos de población anual por zonas.
## COLUMNA: freq
## freq N.Observ full_name
## [1,] A 40358 Annual
## COLUMNA: unit
## unit N.Observ full_name
## [1,] THS 40358 Thousand
##
## CONTABILIZACIÓN Nº REGIONES NUTS A PARTIR DE LA COLUMNA geo
## NUTS Number of Regions
## [1,] 0 34
## [2,] 1 111
## [3,] 2 293
## [4,] 3 1327
## [5,] EU27_2020 1
## [6,] OTHERS 24
##
## COLUMNA: TIME_PERIOD
## TIME_PERIOD N.observ
## [1,] 2000-01-01 1554
## [2,] 2001-01-01 1571
## [3,] 2002-01-01 1571
## [4,] 2003-01-01 1571
## [5,] 2004-01-01 1691
## [6,] 2005-01-01 1691
## [7,] 2006-01-01 1695
## [8,] 2007-01-01 1695
## [9,] 2008-01-01 1716
## [10,] 2009-01-01 1716
## [11,] 2010-01-01 1733
## [12,] 2011-01-01 1733
## [13,] 2012-01-01 1733
## [14,] 2013-01-01 1733
## [15,] 2014-01-01 1770
## [16,] 2015-01-01 1770
## [17,] 2016-01-01 1770
## [18,] 2017-01-01 1770
## [19,] 2018-01-01 1770
## [20,] 2019-01-01 1770
## [21,] 2020-01-01 1735
## [22,] 2021-01-01 1755
## [23,] 2022-01-01 1717
## [24,] 2023-01-01 1128
El dataset (nama_10r_3popgdp) se presenta en una
estructura ordenada (tidy). Esta organización
se define porque cada fila representa una única
observación. Es decir, la combinación de las variables
categóricas y la variable temporal (TIME_PERIOD) define de
forma unívoca la medición. El resultado de esta medición se almacena en
una sola columna numérica (values). Este formato, también
conocido como “formato largo,” es el más eficiente y recomendado para la
manipulación y el análisis directo de datos en entornos de software
estadístico como R.
## tibble [40,358 × 5] (S3: tbl_df/tbl/data.frame)
## $ freq : chr [1:40358] "A" "A" "A" "A" ...
## $ unit : chr [1:40358] "THS" "THS" "THS" "THS" ...
## $ geo : chr [1:40358] "AT" "AT1" "AT11" "AT111" ...
## $ TIME_PERIOD: Date[1:40358], format: "2000-01-01" "2000-01-01" ...
## $ values : num [1:40358] 8011.6 3364.6 276.1 38.1 137.7 ...
Empezamos cargando nuestro dataset, pasamos la variable
TIME_PERIOD a tipo ‘date’ y ordenamos por dicha variable y
por geo.
Ahora, vamos a convertir ‘TIME_PERIOD’ para que únicamente nos
aparezca el año, quitando el día y el mes y además vamos a filtrar para
que solo aparezcan los años desde el 2000 hasta el 2022, ya que son los
años en los que hay más observaciones. Luego, como solo tenemos códigos
de cada región y no sus nombres, vamos a añadirle una tabla que nos
proporciona todos los nombres y su información de NUTS a partir de su
código geo.
A continuación vamos a cargar un dataset de población que toma como
población la media de cada año, esto es lo más correcto para normalizar
datos económicos para los que no se tienen datos per cápita como sucede
en nuestro caso para muchos indicadores. En cada caso que lo
necesitemos, simplemente uniremos esta tabla a otra filtrada con los
paises o provincias que queramos por la columna geo y
TIME_PERIOD y normalizaremos los valores necesarios. Le
cambiamos el nombre a la columna values por
poblacion para evitar confusiones. Eliminamos las columnas
de freq y unit ya que solo tienen un valor y
no nos sirven de nada.
Para este apartado y el siguiente, procederemos a hacer un
breve análisis que va desde dentro de España hacia afuera, terminando
con una visión general sobre algunos datos.
Para empezar, comenzamos viendo la evolución de uno de los
indicadores económicos más importante a nivel de bienestar de la
población por comunidades de España, la renta neta en euros per cápita.
Al analizar la evolución de la renta en las regiones de España, vemos que en general la tendencia es hacia arriba, exceptuando 2005-2010 y 2020, esto probablemente, por sucesos como la explosión de la burbuja inmobiliaria en 2008 y en el caso de 2020 por el covid. Todas siguen un patrón parecido, quitando eso, vemos que Madrid, Navarra y País Vasco son las comunidades con mejor renta neta por persona.
Tras un primer vistazo sobre la renta neta en cada país, echemos un vistazo ahora a la capacidad de ahorro neto en euros per cápita por comunidades de España, y veamos si hay alguna similitud ya que la renta neta y la capacidad de ahorro deberían estar relacionadas. En este caso en lugar de ver una evolución, tenemos datos del último año que nos ofrece este dataset, 2022.
En general, los países que mejor renta neta per cápita presentaban son los que se encuentran más arriba en esta gráfica, como vemos, Canarias se sitúa bastante abajo en estos términos.
Para confirmar que efectivamente una mayor renta neta se traduce directamente en una mayor capacidad de ahorro neto, podemos echar un vistazo a este diagrama de dispersión animado que relaciona estos 2 conceptos por las diferentes comunidades autónomas a lo largo de los años.
Como podemos ver existe una fuerte correlación entre la renta y el ahorro, en general las comunidades con mayor renta disponible también presentan mayor capacidad de ahorro.
Las regiones como País Vasco, Navarra y Madrid se sitúan claramente por encima de la media nacional, mientras que Andalucía, Extremadura o Canarias presentan niveles más bajos tanto de renta como de ahorro. Esto sugiere diferencias estructurales regionales en el poder adquisitivo y la capacidad de ahorro de los hogares.
Y con esta última conclusión de las diferencias estructurales regionales, sería interesante dividir la renta total de España entre las distintas regiones de esta (Norte, Sur, Este, Noreste, Noroeste, Centro, Madrid y Canarias) y representarlo mediante un diagrama de disco para que ver que porcentaje se lleva cada zona, antes de ver el gráfico debemos saber que comunidades se agrupan en las distintas regiones:
Noroeste: Galicia, Principado de Asturias y Cantabria.
Noreste: País Vasco, Comunidad Foral de Navarra, La Rioja y Aragón.
Comunidad de Madrid: Comunidad de Madrid (Constituye una región única debido a su relevancia económica).
Centro: Castilla y León, Castilla-La Mancha y Extremadura.
Este: Cataluña, Comunidad Valenciana e Islas Baleares.
Sur: Andalucía, Región de Murcia, Ceuta y Melilla.
Canarias: Canarias (Constituye una región única por su carácter insular).
Tomaremos como unidad euros per cápita para que la población de cada zona no sea un factor influyente y sea una comparación efectiva.
Tras analizar la gráfica de disco, vemos que efectivamente las regiones del sur de España y Canarias presentan un menor poder adquisitivo y por consecuente, una menor capacidad de ahorro. La mayor parte de la renta cae sobre Madrid y las regiones del Noreste y Noroeste.
Ya que conocemos bien la renta neta que presenta cada comunidad en España, echemos un vistazo ahora a los impuestos sobre renta y patrimonio que se pagan en cada una, medidos en euros por habitante y representados mediante un mapa de calor. Tenemos datos desde el año 2016 hasta el 2022.
El mapa de calor de Impuestos sobre Renta y Patrimonio (D.5) per cápita entre 2016 y 2022 es, en realidad, un mapa de la riqueza regional de España. Los tonos más oscuros confirman la relación fundamental de la fiscalidad: las comunidades que más pagan son las que más generan.
Riqueza como Causa: Regiones como la Comunidad de Madrid, el País Vasco y Navarra muestran la mayor presión fiscal directa (azul intenso). Esto se debe a que su Renta Disponible Neta es históricamente más alta, lo que automáticamente eleva el pago del IRPF debido a su naturaleza progresiva. El alto nivel de impuestos es el resultado de una base imponible (ingresos) superior.
Doble Medición del Impuesto: La variación en D.5 también subraya que no solo mide la renta generada en el año:
*El IRPF refleja los ingresos corrientes.
*Los impuestos patrimoniales (como el IBI) reflejan la riqueza acumulada (stock). Esto explica por qué regiones con alto valor inmobiliario, como las Islas Baleares, pueden tener una alta contribución fiscal per cápita.
Consecuencia Económica: La intensificación general del color azul después de 2020 indica un crecimiento de la renta nominal en el país. En última instancia, esta alta contribución fiscal en las regiones líderes confirma su rol como motores económicos: a pesar de pagar los impuestos más altos, su capacidad de Ingreso y su alto Ahorro Neto (B7N) residual las identifica como los principales centros de acumulación de capital de España.
Para finalizar con las comunidades de España, veamos mediante un diagrama de cajas, como se distribuyen los 3 principales indicadores económicos, Ingreso primario neto, Renta neta y Ahorro neto por las distintas comunidades españolas en euros por habitante.
Como comentábamos, este gráfico muestra la distribución de los distintos tipos de ingreso por habitante en las regiones españolas. Se observa que el ingreso primario (B5N) es el más alto y disperso, mientras que el ingreso disponible (B6N) se reduce tras impuestos y transferencias, evidenciando el efecto redistributivo. El ahorro (B7N) presenta mayor variabilidad, reflejando diferencias regionales en la capacidad de ahorro. Los outliers principalmente se corresponden con regiones con niveles excepcionalmente altos en estos indicadores, sobretodo Madrid y País Vasco como ya hemos visto, donde el PIB y las rentas tienden a ser más elevadas.
Centrémonos ahora en visualizar y comparar a España como país, en este caso tendremos que usar unidades PPS mayoritariamente siempre que el dataset nos ofrezca datos en esta unidad, ya que estamos comparando distintos países.
En primer lugar vamos a utilizar una función de pareto para quedarnos con los países que poseen el 80% de la renta neta de Europa entre los cuales se encuentra España y vamos a ver un gráfico de barras animado que nos muestra la evolución de esos países cada año.
Vemos que, en general, España es un país que se mueve en valores de renta cercanos a los de la media de la Unión Europea. El declive posterior a 2008 es un reflejo de la fuerte dependencia de España de sectores cíclicos (como la construcción y el turismo) y del alto desempleo estructural. Mientras que las economías industriales del norte rebotaron con relativa rapidez tras la crisis financiera, el crecimiento de la renta española se estancó. Vemos que los dos países con mejores niveles de renta neta per cápita son Luxemburgo y Alemania, vamos a comentar estos dos casos por separado.
Luxemburgo es un caso atípico que distorsiona las métricas macroeconómicas de renta per cápita, lo cual es importante para interpretar cualquier resultado:
Centro Fiscal: Gran parte de la renta contable se genera por los beneficios de empresas multinacionales y los flujos financieros que se registran en el país por motivos fiscales.
Efecto de Denominador: Al ser un país pequeño, cuando estos flujos de capital se dividen por una población relativamente reducida, la cifra per cápita se dispara artificialmente, sin que este aumento refleje necesariamente el poder adquisitivo directo del trabajador promedio residente.
La alta renta alemana se sustenta en su potente base industrial y manufacturera.
Valor Añadido Bruto (VAB): El enfoque en la ingeniería, la automoción de alta gama y la química asegura que la producción nacional genere un VAB elevado.
Estabilidad: Esta estructura de exportación de bienes de capital proporciona una fuente de ingresos nacionales estable y constante, lo que se traslada a salarios altos y, por ende, a una renta disponible por habitante consistentemente superior a la media.
Continuémos viendo la evolución económica de los países, en este caso vamos a echar un vistazo a la evolución del ingreso primario neto, es decir, los ingresos brutos per cápita de cada país medidos en unidades PPS. Dado que Europa tiene muchos países, utilizaremos de nuevo la función de Pareto para quedarnos solo con los que poseen el 80% de este valor.
En este caso lo visualizaremos esto con un gráfico de líneas en lugar de uno de barras animado.
En general con este gráfico llegamos a las mismas conclusiones que antes pero, sin embargo, este nos permite más enforcanos que valores toma España con respecto a la media de la Unión Europea, vemos con claridad que hasta antes de la crisis del 2008 España se situaba por encima de esta y que después de dicha crisis no consigue recuperase de la misma manera a pesar de que la tendencia sigue siendo ascendente.
Y bueno ya que venimos viendo la evolución del ingreso primario neto (ingreso bruto), puede ser interesante ver en cada país la intervención del Estado sobre este ingreso primario, es decir, cuánto dinero pierde o gana un hogar después de que el Estado aplica impuestos y devuelve beneficios, para este caso también incluiremos a Canarias junto con los países.
Para cuantificar y visualizar el impacto de la intervención del Estado en el ingreso de los hogares, se utiliza la Renta Disponible Neta, la cual, por definición en las cuentas nacionales, es el resultado final después de aplicar impuestos y transferencias sociales.
Es crucial entender que la Renta Disponible Neta ya incorpora las prestaciones sociales recibidas y otros beneficios, y por tanto, no es necesario incluirlas en la fórmula de cálculo.
Si el resultado es POSITIVO (Ingreso Primario > Renta Neta): El país es un Pagador Neto (El Estado quita más de lo que devuelve).
Si el resultado es NEGATIVO (Ingreso Primario < Renta Neta): El país es un Receptor Neto (El Estado devuelve más de lo que quita).
El gráfico de Efecto Neto de la Redistribución Fiscal muestra una clara y pronunciada polarización económica en Europa, revelando la diferencia entre el Ingreso Primario y la Renta Disponible.
El resultado evidencia que las economías se dividen en dos grandes grupos:
Pagadores Netos (Contribuyentes): Los países del Norte y Centro de Europa (Dinamarca, Países Bajos, Luxemburgo y Alemania) son los mayores contribuyentes netos, con un hogar promedio que cede entre 8.000€ y 10.000€ al Estado después de impuestos y transferencias. Esta fuerte presión fiscal refleja la financiación de robustos Estados de Bienestar y la alta recaudación.
Receptores Netos (Asistencia): En contraste, las economías del Sur y del Este de Europa (incluyendo Grecia, Polonia, Portugal, y Eslovaquia) se sitúan cerca del valor cero o son receptores netos, lo que indica que las prestaciones y transferencias sociales que reciben sus hogares son casi iguales o superiores a los impuestos que pagan.
España se sitúa como un contribuyente neto moderado, lejos de las cifras de cabeza, pero todavía con una contribución positiva, mientras que las regiones periféricas y más débiles (como Canarias en la lista) son, en esencia, fiscalmente neutrales.
En el análisis anterior, vimos el saldo final de la intervención del Estado, identificando qué países eran contribuyentes netos (Pagadores Netos) y cuáles dependían más de las ayudas sociales (Receptores Netos).
Ahora, para entender mejor la magnitud de la diferencia que genera ese saldo, nos centraremos en la salida de recursos obligatoria que soporta cada hogar.
Para calcular esta carga fiscal directa sobre el ingreso, sumamos dos componentes clave que restan directamente de la renta de las familias: los Impuestos Corrientes sobre Renta y Patrimonio y las Cotizaciones Sociales Netas.
Este mapa de calor nos permitirá visualizar qué países y regiones tienen la mayor presión sobre el ingreso per cápita, la cual es necesaria para sostener sus respectivos sistemas de bienestar.
El mapa de calor de la Carga Fiscal Directa y Contribuciones Sociales (D5+D61) revela una nítida polarización entre la Europa del Norte y la del Este, lo cual confirma la solidez de los Estados de Bienestar en las regiones más ricas.
El análisis muestra que los países escandinavos y del Benelux (Dinamarca, Países Bajos y Suecia) imponen la mayor presión fiscal directa sobre el ingreso (por encima de los 20.000€ per cápita en varios casos), lo cual se debe a la financiación de sus amplios sistemas de seguridad social. En contraste, países con economías de menor escala (como Bulgaria, Croacia o Rumania) muestran la carga fiscal más baja. España se posiciona en un nivel intermedio-alto de contribución fiscal, lo cual es coherente con su rol como economía grande en la Eurozona.
El dato curioso es que esta visualización confirma que los países con la mayor presión fiscal (Dinamarca, Países Bajos) son precisamente los que resultaron ser Pagadores Netos en el análisis anterior, demostrando que la magnitud de la recaudación es la que dicta el saldo fiscal final.
Hemos analizado la presión fiscal directa sobre el ingreso de los hogares, que es el coste necesario para financiar los sistemas de bienestar y Cotizaciones. Ahora, es el momento de examinar el resultado final de esa riqueza generada y la capacidad de inversión.
Por último, cerramos el apartado con una visión geográfica y detallada del último año de datos (2022). Usaremos dos mapas coropléticos a nivel de regiones NUTS2 para ver cómo se distribuyen la Renta Disponible Neta y la Inversión en Activos Fijos, lo que nos permitirá extraer conclusiones específicas sobre los focos geográficos de mayor riqueza y dinamismo económico en Europa, utilizaremos unidades PPS para el caso de la Renta Neta y euros por habitante para el caso de la Inversión en Activos Fijos, ya que no tenemos datos con unidades PPS.
De este primer mapa podemos sacar las siguientes conclusiones:
El Eje Central de Riqueza: La renta disponible más alta (tonos rojos) se concentra claramente en el eje central de Europa (el ‘Arco de la Riqueza’): el sureste del Reino Unido (Londres), Benelux, el oeste y sur de Alemania (Baden-Württemberg, Baviera) y Escandinavia. Esto confirma que los países con la mayor presión fiscal directa son los que también tienen la mayor renta per cápita.
Disparidad Extrema: Existe un fuerte clivaje (división) Norte-Oeste/Sur-Este. La renta cae drásticamente en todo el Sur (Italia, Portugal, Grecia) y en los países de la ampliación oriental, que están en el rango más bajo (tonos amarillos).
Efecto Capital: Las capitales y los centros financieros (París, Dublín, Praga, Viena) se destacan como islas de alta renta (puntos rojos oscuros), reflejando la concentración de servicios de alto valor añadido.
Caso de España: España muestra una notable disparidad intra-nacional. Mientras que regiones como Madrid y el País Vasco se sitúan en el rango medio-alto de la UE, la mayor parte del territorio, especialmente Andalucía y Extremadura, se encuentra en el rango medio-bajo, alineado con el sur de Italia.
El mapa de la Formación Bruta de Capital Fijo revela que la inversión productiva se concentra en un eje muy específico de Europa Occidental y Central, que está desvinculado de la distribución de la renta disponible.
Foco de Capitalización: Los niveles de inversión más altos (tonos rojos intensos) se concentran en el tradicional “Cinturón Industrial” que abarca Francia, el norte de Italia (el principal foco), y el sur de Alemania/Austria.
Disparidad con la Renta: A diferencia del mapa de renta, donde Italia y Francia tenían niveles intermedios, aquí muestran la mayor intensidad de inversión. Esto sugiere que, si bien la renta disponible per cápita en estos países es menor que en Holanda o Dinamarca, el capital productivo se está inyectando con mayor fuerza en sus bases industriales.
Caso Español: España y Portugal se encuentran consistentemente en el rango bajo a medio (tonos amarillos y naranjas claros), lo que indica un atraso estructural en la inversión productiva en comparación con el núcleo industrial de la Eurozona.
Todas las gráficas vistas en este apartado se encuentran presentes en el cuadro de mandos del proyecto, en donde se permite una mayor exploración en profundidad de las distintas variables y las distintas regiones.
Empecemos viendo una predicción por comunidades de España de sobre los futuros niveles de renta neta per cápita.
Vamos ahora con un análisis de PCA por comunidades de España.
Vamos a analizar la evolución de la renta neta por habitante en España. Filtraremos a partir del año 2002 ya que fue cuando se introdujo el euro a España.
Sacamos la misma conclusión que de las gráficas, en general la tendencia es hacia arriba excepto en eventos excepcionales como la crisis del 2008 o el covid.
Como vemos en la predicción, no se espera que la evolución de la renta sea muy vertical como sucede en otros años.
A continuación vamos a ver como han evolucionado los impuestos per
cápita en España a lo largo de los años, ya que no tenemos datos por
habitante, tendremos que normalizar las observaciones medidas en
MIO_EUR diviendo dichos valores por la población,
filtraremos a partir del año 2002 ya que fue cuando se introdujo el euro
a España.
Haremos una predicción a 5 años.
TOTAL HORAS TRABAJADAS EN EL PROYECTO : NA
DESGLOSE DETALLADO DE LAS SESIONES DE TRABAJO